91 research outputs found

    Via-cases in the dialects of Komi

    Get PDF
    Non peer reviewe

    Cases Denoting Path in Komi : Semantic, Dialectological and Historical Perspectives

    Get PDF
    This article examines the functions and use of Komi-Zyrian prolative cases. The theoretical background is rooted in cognitive linguistics, and the use of these cases in written Komi is studied with the methods of corpus linguistics. Our analysis shows that the two prolative cases have different distributions and functions, but there are also dialectal and grammatical factors that condition their use. Furthermore, we show that there are parallels between the distribution of these forms in different Permic languages and dialects. We contextualise these findings within Permic dialectology, and provide an analysis of how these forms are related and how they have developed in specific Komi subvarieties.Peer reviewe

    Epic Tradition Shared and Transformed : Comparisons between Kolva Komi and Tundra Nenets Sung Poetry

    Get PDF
    Since the 1960s, a unique Komi singing and narrative tradition has been described in the Kolva region. These materials, sung in the Komi language, were beyond doubt born in interaction with Tundra Nenets sung poetry. Indeed, comparable Nenets songs have been documented from all the regions where Nenets is spoken. We use both published and archived materials to compare individual texts in detail, and show various folkloristic and linguistic parallels. We pay particular attention to shared motives and narrative phases, which we consider very important as in the current state of research where exact parallel texts between the languages cannot be found. These detailed parallel concepts, however, serve as an evidence of the shared origin of these narratives, and also tell us how these Nenets conceptualizations have been transformed when integrated into Komi tradition.Peer reviewe

    On New Text Corpora For Minority Languages On The Helsinki korp.csc.fi Server

    Get PDF
    The korp.csc.fi server in Finland provides text corpora of multiple varieties for numerous languages large and small. The Korp infrastructure is developed by the Swedish Språkbanken in the University and Gothenburg, and the source code is released under MIT license. Open nature of the systems makes it easily transferred into new environments, and there are already numerous Korp installations available. The one we discuss is maintained by the Language Bank of Finland.Peer reviewe

    Kahden suomalais-ugrilaisen yhteisön kielenvaihdon vertailevaa tarkastelua : Tuuksa Karjalassa ja Koigort Komissa

    Get PDF
    Käsittelen pro gradu -tutkimuksessani kielenvaihtoa Karjalassa ja Komissa. Molemmilla alueilla 1800-luvulla enemmistökielenä puhuttu suomalais-ugrilainen kieli on 1900-luvun aikana laajalti korvautunut venäjällä yleisenä käyttökielenä. Aiemman tutkimustiedon perusteella karjala on erittäin uhanalainen koko sen puhuma-alueella, mutta komia käytetään vielä lukuisissa yhteisöissä eri puolilla Komin tasavaltaa. Käytännössä aiempia tapaustutkimuksia on erittäin vähän, eikä ilmiön laajuutta ole yksityiskohtaisesti kartoitettu. Tutkimukseni tavoitteena on kuvata kielenvaihdon etenemistä yhdessä karjalaisessa ja yhdessä komilaisessa kylässä. Nämä kylät ovat Tuuksa Aunuksen piirissä ja Koigort Koigorodokin piirissä. Korostan, että tutkimus on käsitellyt vain pientä kylänosaa ja rajallista osuutta alueen väestöstä, joten tulokset ovat vain osin yleistettävissä laajempaan kontekstiin. Tutkimuksen metodeina on domeenien muutoksen ja kielellisten verkostojen vertailu. Erityistä huomiota on kiinnitetty näennäisaikaiseen muutokseen. Tämän pohjalta arvioidaan eri ikäryhmien kielen käyttöä ja oppimista. Tutkimuksen aineisto on kerätty suomalais-ugrilaisen oppiaineryhmän kenttätyöharjoitusten yhteydessä ja koostuu noin 50 haastattelusta molemmilla paikkakunnilla. Molemmissa tutkimuskohteissa on käytetty samanlaista kyselykaavaketta, jota hyödynnetään soveltuvin osin tässä tutkimuksessa. Työskentely on rajoittunut yksittäisiin naapurustoihin, sillä ainoastaan näin on mahdollista kartoittaa tarkemmin informanttien keskinäisiä suhteita. Samalla esimerkiksi kielenkäytön domeenit kuten naapurit ja kauppa konkretisoituvat, sillä informantit kuvaavat samoja ympäristöjä. Käsiteltyjä domeeneja olivat näiden lisäksi perhe, koti, koulu, työ ja kylä. Erityistä huomiota kiinnitin perheen sisäisiin rooleihin. Tutkimuksen perusteella kielenvaihto on alkanut Tuuksessa aiemmin kuin Koigortissa. Eroa voi pitää jopa yhden sukupolven suuruisena. Tuuksessa jo 1930-luvulla syntyneet ovat usein puhuneet lastensa kanssa venäjää. Suuri merkitys on kuitenkin ollut 1950-luvulla, sillä tällöin kylään muuttaneen venäläisen informantin kuvauksen perusteella paikalliset karjalaiset eivät vielä osanneet venäjää. Tuuksen aineistossa näkyy hyvin jyrkkä muutos, jossa puolison kanssa käytetty kieli on vaihtunut 1950-luvulla syntyneillä. 1960-luvulla venäjästä on tullut sisarusten keskeinen käyttökieli. Myös Koigortissa puolison kanssa käytetty kieli on perhekohtaisesti vaihtunut 1950-luvulla, mutta prosessi ei ole niin kokonaisvaltainen kuin Tuuksessa. Tästä huolimatta kielenvaihto ei ole saavuttanut päätepistettään kummassakaan yhteisössä. Tutkimus kuvastaa erittäin hyvin kielenvaihdon hitautta. Tietyt henkilöt ja ikäryhmät jatkavat kielenvaihdossa väistyvän kielen puhumista vielä kauan kielenvaihdon alettua. Kielellisten verkostojen analyysi kuvasi sitä, kuinka molempia kieliä paljon käyttäneiden keskuudessa väistyvän kielen käyttö painottui juuri vuorovaikutukseen iäkkäimpien ikäkohorttien kanssa. Kielen välittyminen lapsille näyttää jatkuvan paljon kauemmin, kuin yhteisöä nopeasti tarkastellen arvelisi. Tämän katkeamisen voi yleensä rajata hyvin tarkasti tiettyjen henkilöiden kuolemaan tai heidän vähentyneeseen osuuteensa lasten hoidossa. Erityistä huomiota on kiinnitettävä kielitaidon assosioitumiseen eri ikäryhmiin. Kielenvaihtoa käsittelevät diskursiiviset käytänteet voivat selittää kielenvaihtoa paremmin, kuin kielitaidon yksinkertainen arviointi. Jatkotutkimuksen kannalta suositellaan, että kiinnitettäisiin huomiota passiivisen kielitaidon merkitykseen sekä lateraalisiin verkostoihin, joissa kieltä opitaan. Molemmissa kylissä paikallisen suomalais-ugrilaisen kielen voi vielä sanoa välittyvän lapsille, mutta Tuuksessa ei vaikuta olevan lapsia, jotka olisivat karjalan aktiivikäyttäjiä. Koigortissa puolestaan kieli on sporadisesti säilynyt nuorten käyttämänä ja osaamana kielenä. On huomionarvoista, että Koigorodokin piirissä yksittäinen lähiseudun kylä, Griva, on säilynyt ilmeisen kominkielisenä. 1970-luvulla lakkautetusta Kobran kylästä on siirtynyt paljon väestöä Koigortiin, mikä näyttää vahvistaneen kylän kominkielisiä verkostoja. Nyt tavatuilla komia aktiivisesti käyttäneillä nuorilla on kaikilla sukulaisuussuhteita ainakin toiseen näistä kylistä

    Open-Source Morphology for Endangered Mordvinic Languages

    Get PDF
    Peer reviewe

    Lemmatization of Historical Old Literary Finnish Texts in Modern Orthography

    Get PDF
    Texts written in Old Literary Finnish represent the first literary work ever written in Finnish starting from the 16th century. There have been several projects in Finland that have digitized old publications and made them available for research use. However, using modern NLP methods in such data poses great challenges. In this paper we propose an approach for simultaneously normalizing and lemmatizing Old Literary Finnish into modern spelling. Our best model reaches to 96.3\% accuracy in texts written by Agricola and 87.7\% accuracy in other contemporary out-of-domain text. Our method has been made freely available on Zenodo and Github.Comment: la 28e Conf\'erence sur le Traitement Automatique des Langues Naturelles (TALN

    On the questions in developing computational infrastructure for Komi-Permyak

    Get PDF
    There are two main written Komi varieties, Permyak and Zyrian. These are mutually intelligible but derive from different parts of the same Komi dialect continuum,representing the varieties prominent in the vicinity and in the cities of Syktyvkar and Kudymkar,respectively. Hence,they share a vast number of features, as well as the majority of their lexicon, yet the overlap in their dialects is very complex. This paper evaluates the degree of difference in these written varieties based on changes required for computational resources in the description of these languages when adapted fromthe Komi-Zyrian original. Primarily these changes include the FST architecture, but we are also looking at its application to the Universal Dependencies annotation scheme in the morphologies of the two languages.Peer reviewe
    corecore